Apenas dos días después de lanzar GPT-5.3 Instant, OpenAI ha presentado GPT-5.4, su nuevo modelo de razonamiento orientado al trabajo profesional. La compañía lo describe como la confluencia de sus avances recientes en razonamiento, código y flujos de trabajo agénticos en un único modelo. Está disponible desde hoy en ChatGPT bajo el nombre GPT-5.4 Thinking, en la API y en Codex, su entorno para desarrolladores.
El cambio más significativo respecto a versiones anteriores es que GPT-5.4 es el primer modelo de propósito general de OpenAI con uso de ordenador nativo. Esto significa que puede interactuar con interfaces gráficas, hacer clic, navegar por webs y operar aplicaciones a partir de capturas de pantalla, sin depender de herramientas externas. En el benchmark OSWorld-Verified, que mide esta capacidad, el modelo alcanza un 75 % de éxito frente al 47,3 % de GPT-5.2, superando incluso el rendimiento humano, situado en el 72,4 %.
GPT-5.4 presume de menos alucinaciones y ser mejor en tareas de oficina y búsqueda web
OpenAI ha puesto un énfasis especial en reducir los errores factuales. Según sus propias métricas internas, GPT-5.4 genera afirmaciones falsas con un 33 % menos de frecuencia que GPT-5.2, y sus respuestas completas contienen errores un 18 % menos. En tareas profesionales que implican hojas de cálculo, presentaciones y documentos, el salto de rendimiento es notable: en un benchmark interno de modelado financiero al estilo de un analista junior de banca de inversión, el modelo pasa de un 68,4 % a un 87,3 %.
La búsqueda web también mejora considerablemente. En BrowseComp, que mide la capacidad de un modelo para rastrear información difícil de encontrar en la web, GPT-5.4 supera a GPT-5.2 en 17 puntos porcentuales. La versión Pro del modelo alcanza el 89,3 % en ese mismo benchmark.
Para los desarrolladores, el modelo introduce tool search, una función que permite trabajar con ecosistemas de herramientas muy grandes sin cargar todas las definiciones en el contexto desde el principio. En pruebas internas, esta aproximación redujo el consumo de tokens en un 47 %, manteniendo la misma precisión.
En ChatGPT, GPT-5.4 Thinking está disponible para usuarios de los planes Plus, Team y Pro, reemplazando a GPT-5.2 Thinking. Este último permanecerá accesible durante tres meses antes de ser retirado el 5 de junio de 2026. El precio en la API sube ligeramente respecto a GPT-5.2, situándose en 2,50 dólares por millón de tokens de entrada y 15 dólares por millón de tokens de salida.